🦊Ideogram 4.0
🏠 | 🦊雑に学ぶComfyUI
👈 |
👉 |
Ideogram 4.0
モデルのダウンロード
diffusion_models
https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_fp8_scaled.safetensorsideogram4_fp8_scaled.safetensors (9.28 GB)
https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_nvfp4_mixed.safetensorsideogram4_nvfp4_mixed.safetensors (5.49 GB)
https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_unconditional_fp8_scaled.safetensorsideogram4_unconditional_fp8_scaled.safetensors (9.28 GB)
https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_unconditional_nvfp4_mixed.safetensorsideogram4_unconditional_nvfp4_mixed.safetensors (5.49 GB)
text_encoders
https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/text_encoders/qwen3vl_8b_fp8_scaled.safetensorsqwen3vl_8b_fp8_scaled.safetensors (10.6 GB)
vae
https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/vae/flux2-vae.safetensorsflux2-vae.safetensors (336 MB)
code:models
📂ComfyUI/
└── 📂models/
├── 📂diffusion_models/
│ ├── ideogram4_fp8_scaled.safetensors
│ ├── ideogram4_nvfp4_mixed.safetensors
│ ├── ideogram4_unconditional_fp8_scaled.safetensors
│ └── ideogram4_unconditional_nvfp4_mixed.safetensors
├── 📂text_encoders/
│ └── qwen3vl_8b_fp8_scaled.safetensors
└── 📂vae/
└── flux2-vae.safetensors
モデルを2つ使うので VRAMがキツイ
unconditionalの方は nvfp4でも特に問題ないので、fp8(conditional) + nvfp4(unconditional) の組み合わせが良いかもしれない
プロンプトについて
既定のJSONスキーマに従わないとまともにクオリティを出せない。基本形は以下
code:prompt.json
{
"high_level_description": "画像全体の1〜2文の説明。",
"style_description": {
"aesthetics": "雰囲気、審美性。",
"lighting": "ライティング。",
"medium": "illustration / photograph / graphic_design など。",
"art_style": "非写真の場合の画風。",
"color_palette": "#FFFFFF", "#000000"
},
"compositional_deconstruction": {
"background": "背景・環境の説明。",
"elements": [
{
"type": "obj",
"bbox": 100, 200, 800, 700,
"desc": "物体・人物・要素の説明。",
"color_palette": "#FFFFFF", "#000000"
},
{
"type": "text",
"bbox": 820, 200, 920, 800,
"text": "HELLO",
"desc": "文字の見た目の説明。",
"color_palette": "#000000"
}
]
}
}
ただし、こんなものを手で書いてはいられないので以下の方法を使うことになる(と思う)
専用プロンプトビルダーを使う
ComfyUI-KJNodesのIdeogram 4 Prompt Builder KJノードがよく使われている
LLMに任せる
https://github.com/ideogram-oss/ideogram4/blob/main/docs/prompting.md公式プロンプトガイド と 画像や下書き・自然文での指示をLLMに投げて、json形式で答えてもらう
e.g. https://chatgpt.com/share/6a28f7cc-e934-8320-86d6-f790a5274389
ただ、ComfyUI上で動かせるレベルのモデルだと性能が足りないので、大人しくChatGPTなどに投げたほうが良いとは思う
text2image
https://gyazo.com/c9a2cf1717e87cd1ba28c5d236a02b4d
Ideogram_4.0_text2image.json